V2EX  ›  英汉词典

Latent Dirichlet Allocation

释义 Definition

潜在狄利克雷分配(常简称 LDA):一种用于主题建模的概率生成模型,常用来从大量文本中自动发现“主题”(一组经常一起出现的词),并估计每篇文档由哪些主题混合组成。

发音 Pronunciation (IPA)

/ˈleɪtənt dɪˈrɪʃleɪ ˌæləˈkeɪʃən/

例句 Examples

We used latent Dirichlet allocation to find topics in customer reviews.
我们用潜在狄利克雷分配从客户评论中发现主题。

By fitting a latent Dirichlet allocation model with ten topics, the researchers compared how political themes shifted across newspapers over time.
研究人员拟合了一个包含十个主题的LDA模型,从而比较政治主题如何随时间在不同报纸中变化。

词源 Etymology

该术语由三部分构成:latent(“潜在的、未直接观察到的”)指模型中隐藏的主题结构;Dirichlet(狄利克雷)来自数学家 Peter Gustav Lejeune Dirichlet 的姓氏,指一种常用于“概率向量”的先验分布;allocation(分配)强调把词、主题、文档之间的概率“分配/归属”起来。LDA 作为主题建模方法在 2003 年由 Blei、Ng、Jordan 的论文中系统提出并普及。

相关词 Related Words

文学与经典出处 Literary Works

  • David M. Blei, Andrew Y. Ng, Michael I. Jordan. Latent Dirichlet Allocation(2003)
  • David M. Blei. Probabilistic Topic Models(2012)
  • Christopher D. Manning, Prabhakar Raghavan, Hinrich Schütze. Introduction to Information Retrieval(信息检索教材中常提及主题建模与LDA)
  • Daniel Jurafsky, James H. Martin. Speech and Language Processing(自然语言处理教材中常介绍LDA/主题模型)
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2051 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 12ms · UTC 14:44 · PVG 22:44 · LAX 06:44 · JFK 09:44
♥ Do have faith in what you're doing.